{{tag>portail accessibilité audio multimédia}}

----

====== Reconnaissance vocale ======


Cette page est consacrée à la **reconnaissance vocale** sous Ubuntu et plus généralement sous Linux.

[[:KDE]] intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur [[http://en.wikipedia.org/wiki/CMU_Sphinx|CMU Sphinx]].

Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site [[http://www.voxforge.org/fr|Voxforge.org]].
Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.

La [[synthèse vocale]], qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.

===== Logiciels de reconnaissance vocale =====
==== Pour la commande vocale ====

  * [[:NoComprendo]] : commande vocale pour Linux
  * [[:Perlbox]] : permet de commander l'environnement [[KDE]] par la voix. Basé sur Sphinx.
  * [[Simon]] : permet de contrôler de multiples applications (firefox, rhythmbox, ...) ainsi que le bureau aisément. Disponible [[http://sourceforge.net/projects/speech2text/]]
  * **VoiceExecute** : permet de lancer des logiciels par la voix
  * Google search sous [[google_chrome|Chrome]] : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
  * [[https://github.com/kalliope-project/kalliope|Kalliope]] est un framework permettant de créer son propre assistant personnel. Le programme supporte plusieurs langues, possède des modules de reconnaissance vocale(STT) offline et self-hosted. 
  * [[https://github.com/claritylab/lucida|Lucida]] est un assistant personnel intelligent basé sur la parole et la vision inspiré par [[http://sirius.clarity-lab.org/|Sirius]]. Visitez le [[http://lucida.ai/|site Web]] pour le tutoriel, et [[http://groups.google.com/forum/#!forum/lucida-users|Lucida-users]] pour de l'aide. Le projet est publié sous [[https://github.com/claritylab/lucida/blob/master/LICENSE|licence BSD]], sauf pour certains sous-modules qui contiennent leurs propres licence.
  * [[http://jasperproject.github.io/|Jasper]], pour raspberry

==== Pour la dictée vocale ====
  * **X voice** : utilise une librairie ViaVoice d'IBM qui est payante. 
  * [[wp>Dragon_NaturallySpeaking|Dragon Naturally Speaking]] : fonctionne [[http://appdb.winehq.org/appview.php?versionId=3227|moyennement]] sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface [[http://thenerdshow.com/platypus.html|Platypus]].
   * **[[https://www.thenerdshow.com/freespeech.html|FreeSpeech]]**.

==== Autre ====
   * [[http://www.speech.cs.cmu.edu/sphinx/doc/Sphinx.html|CMU Sphinx]] : Sphinx est une bibliothèque écrite en java et a une variante en  C
 
Logiciels dont le développement est arrêté :
   * [[http://www.kiecza.net/daniel/linux/index.html|CVoiceControl]] : n'est plus soutenu par son créateur depuis 2002


=== DeepSpeech le projet de Mozilla ===
[[https://research.mozilla.org/machine-learning/|DeepSpeech]] de la fondation mozilla, buts:
  * Web Speech API
  * Speech recognition
  * Speech-to-Text

=== Dictée vocale en ligne ===

[[https://speechnotes.co/fr/|SpeechNotes]] marche dans Chromium (pas dans Firefox). Non libre. Basé sur le moteur de Google.
=====Voir aussi=====

  *[[https://forum.ubuntu-fr.org/viewtopic.php?id=60231&p=4|Discussion "Reconnaissance vocale"]] sur le forum ubuntu-fr
  *[[synthese_vocale|Synthèse vocale]] (Opération inverse)

===== Pages en rapport =====
{{topic>reconnaissance_vocale&header}}
